#cota inferior

Optimalidad asintótica de Thompson Sampling para bandidos aversos al riesgo

Un algoritmo de Thompson Sampling no paramétrico logra optimalidad asintótica en bandidos aversos al riesgo con recompensas subgaussianas.

2026-06-09 · 2 min

Complejidad del aprendizaje por refuerzo offline con Q* y cobertura parcial

La combinación de Q* y Bellman completa no es suficiente para RL offline con cobertura parcial. Descubre el nuevo marco teórico y mejoras.

2026-06-09 · 2 min

Tasa minimax espacio-temporal para distribuciones suaves en Wasserstein

Descubre la nueva tasa minimax espacio-temporal para distribuciones suaves en Wasserstein. Ideal para investigadores y expertos en OT.

2026-06-08 · 2 min

El costo del aprendizaje con múltiples puntos de cambio

Descubre cómo el algoritmo ATC supera los desafíos del aprendizaje con múltiples puntos de cambio, logrando un rendimiento casi óptimo y evitando la confusión endógena.

2026-06-04 · 2 min

Algoritmos basados en medias: cota inferior y regret

Descubre la primera cota inferior para algoritmos basados en medias en bandidos con horizonte desconocido. Nuevos algoritmos competitivos y su relación con no-regret.

2026-06-04 · 2 min

Optimización de certificados explícitos de cota inferior para distancia unitaria

Descubre cómo optimizar certificados de cota inferior para distancia unitaria mediante algoritmos de optimización entera, mejorando la cota de Erdős a n^{1.0152

2026-06-03 · 2 min

Degustación de manzanas con dos acciones y costos de cambio

Descubre cómo los investigadores demostraron una cota de arrepentimiento de orden √T para el problema de degustación. ¡Lee el artículo!

2026-06-03 · 2 min

Pruebas secuenciales asintóticamente óptimas con datos markovianos

Descubre un método asintóticamente óptimo para pruebas secuenciales en cadenas de Markov. Mejora límites inferiores y aplicaciones en MCMC y MDPs.

2026-06-03 · 2 min

Acoplamientos en difusiones de Langevin cinéticas

Nuevos acoplamientos no markovianos revelan cotas exactas de convergencia para difusiones de Langevin cinéticas, superando limitaciones previas en muestreo.

2026-06-03 · 2 min